6 Statistiek en beslissingen 


Voorkennis Spreiding en steekproeven 


Bladzijde 47 

© a r=10deno=lbgeeftr—o=19,9— 1,6 18,3 en x+o=19,9+1,6=21,5. 
b Erzijn 6 +9 + 5 = 20 leerlingen met een aantal ademhalingen per minuut tussen 18,3 en 21,5. 
ec Detotale frequentie is 1 +1 +3 +6+9+5+3+2=30. 


Dus van a x100% = 66,7%. 








OQ a MerkA 
Voer in lijst 1 = {103, 104, 105, 106, 107, 108, 109, 110} 
en lijst 2= {3, 15, 28, 36, 48, 39, 12, 4}. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 106,6 en o = 1,5. 
Merk B 
Voer in lijst 2= {1, 3, 11, 42, 53, 16, 3, 1}. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 106,6 en o = 1,1. 
Dus bij de steekproef van merk A is het gemiddelde 106,6 gram en de standaardafwijking 
1,5 gram en bij de steekproef van merk B is het gemiddelde 106,6 gram en de standaardafwijking 
1,1 gram. 
b Bij merk B is de vulmachine beter afgesteld, want er is minder spreiding. 





8 Voer in lijst 1 = {9,1; 10,3; 11,8; 14,1; 17,4; 21,2; 24,4; 24,3; 21,7; 17,5; 13,1; 10,0} en 
lijst 2 = {-3,1; -0,6; 4,4; 11,5; 16,1; 20,2; 23,4; 22,8; 18,1; 11,9; 5,7; 0,3}. 
l-Var Stats (TI) of VAR (Casio) geeft met lijst 1 en frequentie 1 dat x= 16,2 en o = 5,4 en met 
lijst 2 en frequentie 1 dat x= 10,9 en o = 9,0. 
Dus bij Barcelona is het gemiddelde 16,2 °C en de standaardafwijking 5,4 °C. 
Bij Boekarest is het gemiddelde 10,9 °C en de standaardafwijking 9,0 °C. 


0 a Bij beiden is de gemiddelde bezorgtijd 40 minuten. 
Bij Ben liggen de meeste bezorgtijden bij 39, 40 en 41 (dus maximaal één minuut naast het 
gemiddelde) en maar 2 van de 24 tijden twee minuten naast het gemiddelde. 
Bij Annet is de spreiding veel groter, er liggen 16 van de 24 tijden twee minuten naast het 
gemiddelde. 
Dus bij Annet is de spreiding het grootst. 
b Schatting bezorgtijd Ben: o = 0,8 minuten. 
Schatting bezorgtijd Annet: o = 1,7 minuten. 


Bladzijde 48 
® a Voer in list 1 = {15, 16, 17, 18, 19, 20, 21} en lijst 2= {8, 3, 1,7, 2, 6, 12}. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 18,49 en o = 2,32. 
Meer dan 1,6 van het gemiddelde geeft waarnemingsgetallen kleiner dan 18,5 — 1,6 = 16,9 en groter dan 
18,5 + 1,6 = 20,1. 
Dus bij de waarnemingsgetallen 15, 16 en 21 en hierbij horen 8 + 3 + 12 = 23 waarnemingen van in 
totaal 8 +3 +1+7+2+6+12=39 waarnemingen. 


Dit geeft 5 x100% = 59,0%. 


b x—-0=18,49 —2,32= 16,17 en x+o= 18,49 + 2,32 = 20,81 
Hiertussen liggen 1 +7 +2 +6 = 16 waarnemingen van de 39. 


Dit geeft En x100% = 41,0%. 








© Noordhoff Uitgevers bv Statistiek en beslissingen 25 


6} a Boxplot A en B zijn beide symmetrisch rond de mediaan 50, dus hierbij zullen II en IV horen. 
Bij A is de spreiding minder groot dan bij B, 
dus bij A horen gemiddelde = 50 en standaardafwijking = 22 (IV). 
Bij B horen gemiddelde = 50 en standaardafwijking = 38 (II). 
Bij D is 75% van de waarnemingen groter dan 50 terwijl bij C 75% groter is dan 40. Bij D verwacht je dus eerder 
een hoger gemiddelde dan andersom. Bij D is de kwartielafstand kleiner dan bij C, je verwacht dus ook dat de 
standaardafwijking bij D kleiner is dan bij C. 
Dus bij C horen gemiddelde = 60 en standaardafwijking = 27 (I). 
Bij D horen gemiddelde = 65 en standaardafwijking = 23 (III). 
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Bladzijde 49 
© Stel er zijn in de steekproef x leerlingen met een bijbaantje. 
re 3 Xx _ 380 
In het geval =p geldt 65 1415 
1415- x= 38065 
380: 65 
= z1 
OE ie 


In de steekproef zitten 17 leerlingen met een bijbaantje. 


(9 } a Er worden 712 huishoudens ondervraagd, dus En = 0,61 is een steekproefproportie. 


b Er geldt Ee x100% = 19,8%, maar hierbij is uitgegaan van de 435 huishoudens die aangeven 
regelmatig op internet te kopen. 
Zou je uitgaan van de 712 ondervraagde huishoudens, dan krijg je En =0,12. 
Dus 12% is een betere schatting. 
e 6% van 435 is ongeveer 26. 
Maar de 435 huishoudens geven aan regelmatig aankopen via internet te doen. 


Daarom zal bij deze 435 huishoudens het percentage hoger zijn dan 6%. 
Daarom is keuzemogelijkheid III (meer dan 30) de juiste. 


6.1 Soorten verdelingen 


Bladzijde 50 
o a Er waren 7 wedstrijden met 2 doelpunten. 

b Erzijnintotaal8+4+7+2+3+6+2+1+1=34 wedstrijden gespeeld. 

ec Erzijnintotaal0:-8+1:4+2:7+3:2+4:34+5:6+6:6+7:1 +8: 1=93 doelpunten 
gescoord. 

d Een wedstrijd met eindstand 2-2 is een wedstrijd met 4 doelpunten. Dus er zijn maximaal 
3 wedstrijden in 2-2 geëindigd. 

e De modus is 0 en het gemiddelde is zeker groter dan 0, want rechts van de staaf bij 0 staan ook 
staven die aantallen doelpunten groter dan nul aangeven. 
Dus het gemiddelde is groter dan de modus. 








Bladzijde 51 
(2 | a Het gemiddelde in figuur 6.8 zal kleiner zijn dan het gemiddelde in figuur 6.6. 
b De mediaan is in beide figuren hetzelfde. 
e De standaardafwijking in figuur 6.8 zal groter zijn dan de standaardafwijking in figuur 6.6. 
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Bladzijde 52 
8 a Eris uitgegaan van de klassenbreedte 2 cm. 

b Jongens zijn over het algemeen langer dan meisjes. In de linker top zitten vooral meisjes en in de 
rechter top vooral jongens. 

ec De modale klasse is de klasse 182-<184. 

d Het gemiddelde is ongeveer 176 cm. De lengten wijken hier gemiddeld ongeveer 8 cm van af. 
Een schatting van de standaardafwijking is dus 8 cm. 

e Als boxplot I bij het histogram zou passen dan zou 25% van de waarnemingen tussen 160 en 164 liggen, 
dat is in figuur 6.9 duidelijk niet het geval. 
Er zitten rechts van 176 cm een stuk meer waarnemingsgetallen dan links van 176 cm. De mediaan zal dus 
groter zijn dan 176 cm. Boxplot III past dus niet bij het histogram. 
Boxplot II past het beste bij figuur 6.9, want ongeveer een kwart van de waarnemingen zit tussen 
179 cm en 183 cm. 


Bladzijde 53 
La} a Nee, de modale klasse is 12000 tot 18000. De mediaan ligt rechts van deze klasse. 
b Nee, als iedereen een gelijk inkomen heeft is dat het enige inkomen dat voorkomt en bestaat de 
verdeling dus uit één staaf. 
e In figuur 6.11 is te zien dat bijna 25% van de jaarinkomens lager is dan 12000 euro. Hierdoor vallen 
boxplots II en III duidelijk af. Boxplot 1 past dus het beste. 


Bladzijde 54 

a symmetrisch 
rechts-scheef 
rechts-scheef 
symmetrisch 
rechts-scheef 





aes 


Q Bij hoort E. 
Bij II hoort B. 
Bij III hoort A. 
Bij IV hoort C. 
Bij V hoort D. 


Bladzijde 55 
{7} a Veel geboorten vinden plaats in het ziekenhuis, dus nuljarigen maken veel kosten. 

b De staaf bij de klasse 55-59 is de eerste die boven 1360 euro uitkomt. Dus vanaf de leeftijdsgroep 
55-59 jaar zijn de kosten meer dan gemiddeld. 

ec De kosten zijn per persoon. Irma gaat ervan uit dat elke klasse evenveel personen bevat, maar dat blijkt 
niet uit figuur 6.14. 

d De klassenbreedtes zijn niet gelijk. De klasse van de nuljarigen is 1 jaar breed, de meeste andere 
klassen zijn 5 jaar breed. 

e 45-49 kosten = 1000: 1 300000 = 1,3 milard euro 
75-19 kosten = 4000 : 450 000 = 1,8 miljard euro 
De groep 75-79 heeft dus de hoogste totale kosten. 

f Zie vraag e, de totale kosten zijn in de klasse 75-79 hoger dan in de klasse 45-49. De modale 
klasse ligt dus nogal aan de rechterkant van het histogram. Er is dus sprake van een links-scheve 
verdeling. Mark heeft dus gelijk. 


Bladzijde 56 
(8 | De modus zal kleiner zijn dan de mediaan, want de modus zit vrijwel helemaal links en dan heb je 
nog niet de helft van de waarnemingsgetallen. 


Bladzijde 57 
(9 | a Bij de top van de verdelingskromme hoort de grootste frequentie, dus de cumulatieve 
verdelingskromme neemt daar het meest toe ofwel daar is het steilste stuk van de 
verdelingskromme. 
b De cumulatieve verdelingskromme is overal even steil, de verdelingskromme is dus overal even 
hoog, dus er is sprake van een uniforme verdeling. 
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(10) a Aflezen bij 50% geeft de mediaan 12. 
b Er zijn twee steile gedeelten in de cumulatieve verdelingskromme, dus er is sprake van een 
tweetoppige verdeling. 








(11) a Weinig waarnemingsgetallen in het begin en veel op het eind. 





0 20 
b Het is een links-scheve verdeling. 
ec Het gemiddelde ligt links van de mediaan. 


@ a De mediaan ligt rechts van de modus. 
b Het steilste stuk zit ongeveer bij 25 000 euro. 
De mediaan is ongeveer 50 000 euro. 


Ada relatieve cumulatieve frequentie 
Br 


50% | 
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jaarinkomen in euro 





t } Í 
0 50000 100000 150000 
jaarinkomen in euro 





6.2 De normale verdeling 


Bladzijde 59 
©® a Eris uitgegaan van een klassenbreedte van 5 cm. 
b De groep bestaat uit 15 + 80 + 235 + 370 + 210 + 80 + 10 = 1000 personen. 








… 680 es 

€ Datis oog “100% = 68%. 
… 950 En 

d Datis oog “100% 95%. 


B a De klassenbreedte is 1 cm. 
b De frequentie van de klasse 182 -< 183 is ongeveer 375. 
ec Nee, bij figuur 6.24 is de groep veel groter. 
In figuur 6.24 is het aantal mannen met een lengte tussen 180 en 185 cm al ongeveer 
5350 = 1750. 
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Bladzijde 61 
® Normale verdeling bij a, c, e en f. 


© « 








155 160 165 170 175 180 185 
lengte in cm 


b 34% + 34% + 13,5% = 81,5% 
e 2,5% 

d 13,5% + 2,5% = 16% 

e 13,5% + 34% = 47,5% 


Bladzijde 62 
Ga 13,5% + 34% + 34% — 81,5% 
Dus 0,815 : 5000 = 4075 appels. 
b 84%, dus 0,84: 5000 = 4200 appels. 














… 125 
12 x 100% =2,5%. 
c 5 is 5000 00% = 2,5% 
Dus zwaarder dan 202 gram. 147 158 169 180 191 202 213 


gram 





(18) 16% weegt minder dan 76 gram, dus 76 ligt één standaardafwijking van het gemiddelde af. 
De standaardafwijking is 80 — 76 = 4 gram. 


© a 2,5% 
b 13,5% + 68% = 81,5%, dus 0,815 : 200 = 163 konijnen. 
e 2,5% + 13,5% = 16%, dus 0,16: 200 = 32 konijnen. 








d ee x 100% = 2,5%, dus deze hebben een gewicht 
van meer dan 2,7 kg. 12 15 18 21 24 27 80 


kg 


€) Om in een van de buitenste vakjes terecht te komen moet een knikker óf steeds naar links óf steeds 
naar rechts vallen. 
Er is maar één route naar een buitenste vakje. Naar de middelste vakjes zijn juist heel veel routes. 


@ a Met stijgende leeftijd neemt iemands reactietijd toe. Bij de 18-jarigen hoort kromme A (kleinste 
gemiddelde), bij de 60-jarigen hoort kromme C (grootste gemiddelde). 
b Bij kromme C hoort de grootste standaardafwijking, dus bij 60-jarigen is het genoemde 
percentage het grootst. 

















Bladzijde 63 
@ a D,B,A,C _ 

b Kromme A: u = 65 en o = lil ES 1,7. 
Kromme B: u = 66,5 en o= ú 63 z1,2. 
Kromme C: u= 67,5 en o= en 2,2: 

71,5 — 68,5 
Kromme D: u = 70 en o 6 0,5. 


B a Lees af bij 50%. Je krijgt u = 7,8. 
b Bij u + o hoort 50% + 34% = 84%. 
Aflezen geeft u + 0 = 8,9. 
€ 0=8,9-7,8=1,1 
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Bladzijde 66 


SS 
== St 
D= 
=| 
© o 
© © 
| 
en 
ed ek 
ve te 
jealjaa) 
kad 


Dus 74% — 11% = 63%. 
b Lees af: bij 80% hoort ongeveer 13,3 mm. 


Dus de grootste 20% van de olijven heeft een diameter van meer dan 13,3 mm. 


ce Bij de groene olijven is u = 12 mm. 


Lees af bij 84% dat u + 0 = 13,6 mm, dus a = 1,6 mm. 
Dus bij de zwarte olijven is u = 14 mm en o 


0,8 mm. 


Teken dus de lijn door (14, 50) en (14,8; 84). 











diameter in mm 
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€D Bij 170 em hoort 15%. 
Bij 185 em hoort 75%. 
Lees af bij 50% dat u = 179 cm. 
Lees af bij 84% dat u +0 = 188, dus o = 188 — 179 = 9 cm. 


99,99 mn 
| 
RaEnEnnn EEEEEEEN Ld 


99,5 






































165 170 175 180 185 190 195 
lengte in cm 


(26) a Evenwijdig betekent dezelfde standaardafwijking. 
b Dat de bladlengte van soort A een kleinere standaardafwijking heeft dan die van soort C. 
ec Dat zowel bij soort C als bij soort D 80% van de bladeren korter is dan 45 mm. 
d De lijnen bij B en D moeten elkaar dan snijden op een hoogte van 50. 


6.3 Betrouwbaarheidsintervallen 


Bladzijde 68 
(27) a De populatieproportie is het gedeelte van de populatie met een bepaald kenmerk, 
en dat gedeelte is hier 12% ofwel 0,12. 
b * 
Vind je bijvoorbeeld 14, dan is de steekproefproportie 0,14. 
c al 
d * 
e Bij een grotere steekproeflengte liggen de steekproefproporties tussen nauwere grenzen. 
f Tussen 0,09 en 0,15. 
g Dat zijn de grenzen 0,10 en 0,14. 
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Bladzijde 70 


n 0,18- 0,82 
a n=4lenp=p=0,18 geeft o= a 0 


b Er geldt =p =0,18 en o = 0,06, dus u — 20 = 0,18 — 0,12 = 0,06 en u + 20 = 0,18 + 0,12 = 0,30. 
Volgens een van de vuistregels van de normale verdeling heeft 95% van de steekproeven een 
steekproefproportie tussen 0,06 en 0,30. 

e 64 is 32% van 200, dus je hebt met de vuistregel bij de normale verdeling te maken die over 68% 
gaat. 

De 64 steekproeven hebben een steekproefproportie die minder is dan 0,18 — 0,06 = 0,12 of meer 
dan 0,18 + 0,06 = 0,24. 





Bladzijde 71 


8 0,28- 0,72 
Da n= 125 en p=p=0,28 geeft o= ps 0040159... 


De standaardafwijking is ongeveer 4,02%. 
25 45 
b 125 = 0,20 en 125 0,36 
Er geldt u =p = 0,28 en o = 0,04, dus u — 20 = 0,28 — 0,08 = 0,20 en u + 20 = 0,28 + 0,08 = 0,36. 
Volgens een van de vuistregels van de normale verdeling heeft 95% van de steekproeven een 
steekproefproportie tussen 0,20 en 0,36. 
Dat zijn 0,95 : 760 = 722 steekproeven. 
40 
== 0,32 
8 jas 0e 
u+o=0,28 + 0,04 = 0,32 
Dus bij 16% van de steekproeven. 
Dat zijn dus 0,16: 760 = 122 steekproeven. 
d de = 0,20 en u — 20 = 0,28 — 0,08 = 0,20 
Dus bij 2,5% van de steekproeven. 


Dat zijn er 0,025: 760 = 19. 


10,120- 0,880 
€ a n=117 en p=p=0,120 geeft o — gy 0300. 


Dus het percentage van 3,0% is juist. 
18 
—_ =0,1538.… 
b 17 0,153 
Er geldt 4 = 0,120 en o = 0, 030, dus u +0 = 0,120 + 0,030 = 0,150. 
Dus bij ongeveer 16% van de steekproeven. 
Dat zijn 0,16: 365 = 58 steekproeven. 
Jl 
€ 7 0,0598… 
u—25=0,120 — 0,060 = 0,060 
Dus bij 2,5% van de steekproeven. 
Dat zijn 0,025: 365 = 9 dagen. 
2 
—_ =0,0170... 
d 17 0,0170 
Omdat u — 35 = 0,120 — 0,090 = 0,030 en 0,017 < 0,030 zal het vrijwel nooit voorkomen dat in een 
steekproef hoogstens 2 pakken zitten met te weinig inhoud. 
Dus het kan niet kloppen wat de bedrijfsleider beweert. 


l0,75-0,25 
€ Bij n — 80 en p—0,75is o go 005 


Omdat 0,75 — 0,05 = 0,70 en 0,75 + 0,05 = 0,80 kan het ook best zijn dat minder dan 70% of meer 
dan 80% dezelfde favoriete sport heeft. 
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Bladzijde 74 
a p—o5=0,63 0,013. = 0,616 

P+0=0,63 + 0,013... = 0,644 
Het 68%-betrouwbaarheidsinterval is [0,616; 0,644]. 
„_ 378 0,63: 0,37 A 

b P= 600 63 en o = 600 =0,0197.… = 0,020 

e P—-20=0,63—2-0,0197… = 0,591 
P+25=0,63 + 2-0,0197.… = 0,669 
Het 95%-betrouwbaarheidsinterval is [0,59 1; 0,669]. 

d Bij de steekproeflengte 1200 hoort een kleiner 95%-betrouwbaarheidsinterval dan bij 
steekproeflengte 600. 
Dus bij steekproeflengte 1200 hoort een grotere nauwkeurigheid dan bij steekproeflengte 600. 





Bladzijde 75 
235 0,2797… + 0,7202… 
Dn OTT 5 =0,0154... 
® ap 340 0,2797… en o 840 0,015 


P-—25=0,2797.… —2:0,0154... = 0,249 

P+20=0,2797.… +2:0,0154... = 0,311 

Het 95%-betrouwbaarheidsinterval is [0,249; 0,311]. 
146 0,3106.… - 0,6893… 


b Pr SE en o= 470 =0,0213... 


P—20=0,3106... — 2-0,0213… = 0,268 

PD +25=0,3106.. +2-0,0213… = 0,353 

Het 95%-betrouwbaarheidsinterval is [0,268; 0,353]. 
ec Van de vrouwen rookten er 235 — 146 = 89. 

„89 0,2405… + 0,7594… 


P= ng — 2405. en o= 10 =0,0222.… 


Î — 20 =0,2405.… — 2-0,0222.… = 0,196 
P +20 =0,2405.… + 2-0,0222.… = 0,285 
Het 95%-betrouwbaarheidsinterval is [0,196; 0,285]. 











… 47 0,0817… -0,9182… 
Da P= 575 00817. en o= en =0,0114.. 
P—25=0,0817.… —2-0,0114. = 0,059 
Î +20 =0,0817… +2-0,0114… = 0,105 
Het 95%-betrouwbaarheidsinterval is [0,059; 0,105]. 
b 40 = 0,296 — 0,224 = 0,072 





0,072 





Dus de standaardafwijking is 0 = = 0,018. 


® De steekproefproportie van de mensen die zeggen op A te gaan stemmen is Î = oe =0,5208.… 


0,5208… + 0,4791… 
935 





De bijbehorende standaardafwijking is o = =0,0163... 


P—25=0,5208… — 2-0,0163... = 0,488 

Om de verkiezingen te winnen zal kandidaat A meer dan 50% van de stemmen moeten 
krijgen (p > 0,5). 

Omdat 0,488 < 0,5 kun je niet met een betrouwbaarheid van 95% zeggen dat kandidaat A de 
verkiezingen zal gaan winnen. 








0,60 -0,40 4 0,24 


D p-osscere, 7 À 


[0,24 
Omdat 0 = 2% = 0,02 krijg je — 0,02. 
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Bladzijde 76 
(37) 40 = 0,46 — 0,34 = 0,12, dus 0 = 0,03. 


0,34 + 0,46 


p= =040 


2, 








0,40: 0,60 0,24 
in n Ie n 
[0,24 
Je krijgt de vergelijking „ 0,03. 
î 0,24 
Voer in y, =\/ — en y= 0,03. 


Intersect geeft x = 267, dus de steekproefomvang is 267. 


©. 











0,35 - 0,65 0,2275 
p= 0,35 geeft o = 7 = 7 


10,2275 
Je krijgt de vergelijking „ 0,025. 


0,2275 
@ 








Voer in y‚ = en y‚ = 0,025. 

Intersect geeft x = 364. 

De omvang van de steekproef moet minstens 364 zijn. 
0,38 - 0,62 


= 364 = =al n= 0,0254... 
n= 364 en p= 0,38 geeft o 364 0,025 


Nu is g> 0,025, dus dan was een steekproefomvang van 364 niet voldoende geweest. 


Als het een 95%-betrouwbaarheidsinterval betreft is 45 = 0,61 — 0,49 = 0,12, dus o = 0,03. 








‚ 0,55-0,45 _ [02475 

P=0,55 geeft o = zi = ii 
0,2475 

Je krijgt de vergelijking ‚/— „ _=0,03. 








10,2475 
Voer in y, = gy eny,= 0,03. 


Intersect geeft x = 275, dus dan zijn 275 D66-stemmers ondervraagd. 





0,12 
Als het een 68%-betrouwbaarheidsinterval betreft is o = 2 = 0,06. 


„2475 





Je krijgt de vergelijking 


0,2475 
Voer in y, = yen = 0,06. 


Intersect geeft x = 69, dus dan zijn 69 D66-stemmers ondervraagd. 


= 0,06. 


en) 
SP 





® Stel de steekproefproportie van de ondervraagden die het examen niet te moeilijk vond is j. 


PU —P) 





Je krijgt d lijki “on 0,012, 
e krijgt de vergelijking 850 f 

N XL =#) 
Voer in y, = 85 en y, = 0,012. 


Neem bijvoorbeeld Xmin = 0, Xmax = 0,3, Ymin = 0 en Ymax = 0,024. 
Intersect geeft x = 0,1427…, dus Î =0,1427… 
Het aantal ondervraagden dat het examen niet te moeilijk vond is 0,1427… 850 = 121. 
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6.4 Groepen en kenmerken 


Bladzijde 78 
CD a Het zijn rechts-scheve verdelingen. 
b Verdeling I heeft het grootste gemiddelde, want bij verdeling 1 zijn meer waarnemingen groter dan 100 en 
minder waarnemingen kleiner dan 100 dan bij verdeling II. 
Verdeling II heeft de grootste standaardafwijking, want daar zijn de waarnemingen meer gespreid 
dan bij verdeling I. 


Bladzijde 79 
®@ Boxplot II hoort bij verdeling A, want verdeling A heeft een langere staart. 


® a De oppervlakte onder kromme B is groter dan de oppervlakte onder kromme A, dus bij B horen meer 
waarnemingsgetallen dan bij B. 
b Bij A is de standaardafwijking ongeveer 30 — 20 = 10 en bij B is de standaardafwijking ongeveer 80 — 60 =20. 





0 10 20 30 40 50 60 70 80 90 +100 110 120 130 140 
aantal 
ar u-3o-70-3:5=55enu+3o=70+3:5=85 
HU u-3o=50-3:15=Senu+3o=50+3:15=95 
De oppervlakte onder 1 is twee keer zo groot als de oppervlakte onder II. 























I 
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Bladzijde 80 
® a In de figuur staat de procentuele verdeling, dus je weet niets van de absolute bedragen. 

Ik ben het niet eens met Hendrik-Jan. 

b Stel Harmsen heeft in totaal 100 opdrachten uitgevoerd. 
Dan had hij 35 opdrachten uit categorie A die hem minder dan 35 : 250 = 8750 euro opleverden. 
En dan had hij 20 opdrachten uit categorie C die hem in totaal minimaal 20 : 500 = 10 000 euro 
opleverden. 
Dus hij had meer omzet in categorie C dan in categorie A. 

ec Van de opdrachten van Veldman had 50% een factuurbedrag tot 2000 euro, de mediaan is dus 2000. 
Dus P hoort bij Veldman en Q bij Harmsen. 

d Deze kromme hoort bij hovenier Harmsen, immers bij de relatieve cumulatieve frequentie 
50 hoort een factuurbedrag van iets minder dan 400 euro en dat hoort bij Harmsen. 

e Bij Veldman hoort de volgende tabel. 


rel. cum. freq. 5 | 16 | 30 | 50 
factuurbedrag in euro’s | 250 | 500 | 1000 | 2000 







































































FACTUURBEDRAGEN 
relatieve cumulatieve frequentie 
100 
Harmsen 
80 
60 
Ap Veldman 
20 
0 
0 1000 2000 
euro's 
Bladzijde 81 


® Nee, het kan ook juist andersom zijn. Ook kan het zijn dat beide een gevolg zijn van een derde 
(niet genoemde) oorzaak. De onderzoekers kunnen dus niet zomaar zeggen dat het één een gevolg 
is van het ander. 


Bladzijde 82 
CD a het warme weer 
b de leeftijd 
e de toegenomen welvaart 
d de lichaamslengte 


© 


Geen causaal verband. Aan voorwaarde 2 (de tijd) is niet voldaan. 

Wel een causaal verband. 

ec Geen causaal verband. Aan voorwaarde 3 is niet voldaan. Bij een grote brand zijn meer 
brandweerlieden aanwezig, maar die veroorzaken de grote brand niet. 

d Wel een causaal verband. 

e Geen causaal verband. Aan voorwaarde 3 is niet voldaan. In een straat met veel BMWs zijn 

veel rijke gezinnen en die verbruiken wellicht meer energie. 


5 


® Als de dokter bijna alleen mannelijke patiënten heeft, is het percentage ongeveer 22%, bij vrijwel alleen 
vrouwelijke patiënten 18%. Voor een mix van mannen en vrouwen zal het percentage dus tussen de 
18% en 22% liggen. Dus conclusie 3 kun je trekken en conclusie 1 niet. 
Omdat geen absolute aantallen bekend zijn, kun je de conclusies 2 en 4 niet trekken. 


Bladzijde 84 

(50) Alleen bij puntenwolk a zou de conclusie van de onderzoeker wel juist zijn, want hierbij zijn 
zowel in de vakken recht onder en recht boven de gekleurde rechthoek geen punten en ook 
niet in de vakken links en rechts van de gekleurde rechthoek. 
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Ja, want de lijn die bij 50 hoort is vrijwel een rechte lijn. 

Ja, want de lijnen lopen steeds verder uit elkaar. 

Nee, na 36 weken is de mediaan van de gewichten ongeveer 2600 gram. Dus dan weegt de helft 

van de jongens minder dan 2600 gram en de helft meer dan 2600 gram. 

4 Nee, in week 28 weegt 10% van de jongens 1500 gram of meer en in week 36 weegt 10% van de 
jongens ongeveer 3000 gram of meer. Dat is iets anders dan dat 90% van de jongens is gegroeid 
van 1500 naar 3000 gram. 

5 Ja, deze conclusie is juist. Zie conclusie 4. 


N= 


Bladzijde 85 

@ Dat kan hij niet concluderen. Mensen die vlees eten hebben wellicht een andere levensstijl dan 
vegetariërs. De enige conclusie uit het artikel kan zijn dat mensen met een hoge bloeddruk wellicht 
baat hebben bij een vegetarisch dieet. 


® Dat kan ze niet concluderen. Depressieve mensen besteden wellicht minder aandacht aan de persoonlijke 
verzorging, dus misschien is het juist wel omgekeerd, dus dat depressiviteit een slecht gebit veroorzaakt. 


@ Dat zijn 123inkt.nl, Navulwinkel en Q-Nomic. Bij deze drie leveranciers is de prijs per mL laag, 
terwijl de tevredenheid goed tot zeer goed is. 


Bladzijde 86 
® a Bij G=0 is oppervlakte 4 gelijk aan nul en oppervlakte B niet gelijk is aan nul. 
Omdat de formule bij 4 = 0 als uitkomst G = 0 moet geven komen alleen de formules I en III in 
aanmerking (de uitkomst van een breuk is nul als de teller nul is). 





Omdat bij B = 0 moet horen G = 1 is formule III juist. Immers B = 0 geeft dan G= ll 1. 





Nee, de tabel gaat over inkomens en niet over vermogens. 





b 1 Nee, de Gini-coëfficiënt van het besteedbaar inkomen is laag. rte 
2 Ja, de Gini-coëfficiënt van het besteedbaar inkomen schommelt tussen 0,273 en 0,281. 
3 Ja, dat klopt. Zo geldt voor 2012 bijvoorbeeld dat 057 =1,97. 
4 
5 


0,249 8 
530 x100% = 47,0% en in 2012 was het 


In 2010 was deze herverdeling 0 


0,266 


0,540 
Dus de conclusie is juist. 





x 100% = 49,3%. 


Diagnostische toets 


Bladzijde 88 
(1) a Een links-scheve verdeling en een tweetoppige verdeling. 

b Er zijn veel leerlingen die de woordjes heel slecht hebben geleerd en er zijn veel leerlingen die de 
woordjes heel goed hebben geleerd. 

e gemiddelde 4,6 
mediaan 2 
standaardafwijking 4,0 

d Bijvoorbeeld cijfer 100 intikken in plaats van 10. 


(2 } a Bij relatieve cumulatieve frequentie 50 hoort het waarnemingsgetal 2,8. Dus de mediaan is 
ongeveer 2,8. 
b Veel waarnemingen aan het begin en weinig op het eind, dus een rechts-scheve verdeling. 


0 10 
d Nee, de mediaan is ongeveer 2,8 (zie vraag a) en dit is bij de boxplot niet het geval. 
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©: 








81 100 119 138 157 176 195 
gram 


Meer dan 157 gram is 13,5% + 2,5% = 16%. 
b 2,5%, dat zijn dus 0,025 : 120 = 3 bananen. 


ec Het gemiddelde is nn = 156 gram. 


65 = 222 — 90 = 132 gram, dus de standaardafwijking is o = En =22 gram. 


Bladzijde 89 


@ A heeft het kleinste gemiddelde, dus III hoort bij A. 
Van B en C heeft C de kleinste standaardafwijking (de lijn die bij C hoort is steiler dan de 


lijn die bij B hoort), dus I hoort bij C. 
Dus bij 4 hoort IIL, bij B hoort Il en bij C hoort 1. 


D(L -p) [02-08 
Os o-lb-orseno |d| op 00447. 








In één decimaal nauwkeurig is a = 4,5%. 
b u+20=0,2+2:0,045 = 0,29 
Dus 30% past niet binnen het 95%-betrouwbaarheidsinterval. 


0,17-0,83 
jen 
an 80 


u+ao=0,17 + 0,042 = 0,212 
Je verwacht 16% van de scholen met een percentage van 21% of hoger. 
16% van 25 is 4 











Dus 4 scholen met een percentage van 21% of hoger is niet uitzonderlijk. 


d Breedte 0,16 betekent 45 = 0,16, dus 5 = 0,04. 
Stel n leerlingen per school ondervragen. 


0,17: 0,83 0,1411 
Er geldtdano =| En ° : 














n 
0,141 1 
Je krijgt de vergelijking 7 0,04. 
0,1411 
Voer in y, = Een 0,04. 


Intersect geeft x = 88,2, dus minstens 89 leerlingen per school ondervragen. 


verdeling binnen de cijferklassen is. 


(7 | Bij c is geen sprake van een causaal verband, want agressieve jongeren spelen wellicht vaker 


gewelddadige computergames. 


Bij d is geen sprake van een causaal verband, want er zijn veel meer oorzaken waardoor de 


levensverwachting is toegenomen. 


38 Hoofdstuk 6 


Deze conclusie kun je trekken. In 4HA is dat ongeveer 65% en in 4HB is dat 60%. 
II Die conclusie kun je niet trekken, omdat je geen absolute aantallen weet. 
III Deze conclusie kun je niet trekken. Om deze conclusie te kunnen trekken, moet je weten hoe de 
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